Рассматриваются наиболее перспективные методы классификации электроэнцефалографических сигналов при разработке неинвазивных интерфейсов мозг–компьютер и теоретических подходов для успешной классификации электроэнцефалографических паттернов. Приводится обзор работ, использующих для классификации риманову геометрию, методы глубокого обучения и различные варианты предобработки и кластеризации электроэнцефалографических сигналов, например общего пространственного фильтра. Среди прочих подходов предобработка электроэнцефалографических сигналов с применением общего пространственного фильтра часто используется как в офлайн, так и в онлайн режимах. Согласно исследованиям последних лет сочетание общего пространственного фильтра, линейного дискриминантного анализа, метода опорных векторов и нейронной сети с обратным распространением ошибки позволило достигнуть 91% точности при двухклассовой классификации с обратной связью в виде управления экзоскелетом. Исследований по использованию римановой геометрии в условиях онлайн очень мало, и на данный момент наилучшая точность при двухклассовой классификации составляет 69,3%. При этом в офлайн тестировании средний процент классификации в рассмотренных статьях для подходов с применением общего пространственного фильтра – 77,5±5,8%, сетей глубокого обучения – 81,7±4,7%, римановой геометрии – 90,2±6,6%. За счет нелинейных преобразований методы, основанные на римановой геометрии, а также на применении глубоких нейронных сетей сложной архитектуры, обеспечивают большую точность и способность к извлечению полезной информации из сигнала по сравнению с линейным преобразованием общего пространственного фильтра. Однако в условиях реального времени важна не только точность, но и минимальная временная задержка. Здесь преимущество может быть за подходами с использованием преобразования общего пространственного фильтра и римановой геометрии с временной задержкой менее 500 мс.
Представлено взаимодействие с 3D-моделями в среде виртуальной реальности (ВР), которое соотносится с движением реальной руки человека. Точность позиционирования достигается благодаря обратной связи. Ключевую роль в поиске оптимальных значений управляющих сигналов играет адаптивная нейро-нечеткая система вывода (Adaptive Network-based Fuzzy Inference System, ANFIS), сочетающая в себе преимущества нейронных сетей (NN) и нечеткой логики (fuzzy logic, FL).
Данный подход дает точные результаты при добавлении обучающей сигнальной системы к комбинированной обучающей базе, используемой при объединении метода пропорций наклона; ошибка наименьших квадратов (LSE) подготавливает ANFIS к любым фреймворкам. Контроллер на основе ANFIS был применён к робототехнической системе с семью степенями свободы, модель которого была разработана в виртуальной реальности, воспроизводящей системные конструкции через Matlab/Simulink, чтобы соединить ВР-модель с инструкцией для выполнения команд гибридным интеллектуальным контроллером на основе технологии ANFIS. Данная усовершенствованная процедура при внедрении полученных результатов показывает возможность практического использование предлагаемой системы контроллера.
Распознавание эмоций в речи стало одним из важных направлений в области аффективных вычислений. Это комплексная задача, трудности которой во многом определяются необходимостью выбора признаков и их оптимального представления. Оптимальное представление признаков должно отражать глобальные характеристики, а также локальную структуру сигнала, поскольку эмоции естественным образом длятся во времени. Подобное представление возможно моделировать с помощью рекуррентных нейронных сетей (РНС – RNN), которые активно используются для различных задач распознавания, предполагающих работу с последовательностями. Предлагается смешанный подход к представлению признаков, который объединяет традиционные статистические признаки с последовательностью значений, полученных на выходе РНС с длинной кратковременной памятью (ДКП – LSTM) и хорошо моделирующих временную структуру сигнала. Таким образом, удается получить одновременное представление как кратковременных, так и долгосрочных характеристик, позволяющих использовать преимущества обоих подходов к моделированию признаков речевого сигнала. Для экспериментальной проверки предложенного метода была произведена оценка его эффективности на трех различных базах данных эмоционально окрашенной речи, находящихся в свободном доступе: RUSLANA (русская речь), BUEMODB (турецкая речь) и EMODB (немецкая речь). В сравнении с традиционным подходом результаты наших экспериментов показывают абсолютный прирост в точности распознавания эмоций в 2.3% и 2.8% для двух из вышеупомянутых корпусов, в то время как для третьего корпуса предложенный метод не уступает базовой системе. Следовательно, данный подход можно признать эффективным для моделирования эмоциональной окраски речевых высказываний при условии достаточного количества обучающих данных.
В статье описаны результаты обработки электромиограммы (ЭМГ) и результаты распознавания мимических движений алгоритмом радиальной базисной функции нейронной сети (НС). В качестве входного вектора признаков использовались девять признаков-функций ЭМГ во временной области. Наиболее высокая точность распознавания и скорость обучения получены для признака «Максимальные значения», наихудший результат получен для признака «Среднее арифметическое». На основе полученных данных предложен алгоритм распознавания движений. Классификатор может применяться для создания интерфейсов вида «человек-машина».
1 - 4 из 4 результатов